1_[图像分类]任务数据标注.md 1.3 KB

1. 准备「图像分类」任务数据

1.1 图像分类的数据结构

图像分类的数据集存放结构如下:

data/mydataset/
|-- train_img
    |-- train_0001.jpg
    |-- train_0002.jpg
    |-- ...
|-- val_img
    |-- val_0001.jpg
    |-- val_0002.jpg
    |-- ...
|-- test_img
    |-- test_0001.jpg
    |-- test_0002.jpg
    |-- ...
|-- train_list.txt
|-- val_list.txt
|-- test_list.txt

其中.txt文件用于存放与相应图像对应的标注信息,train_img、val_img、test_img用于存放训练集、验证集、测试集的图像,而val_img是非必须的; 同时.txt文件名字固定,其余文件名字可自己根据实际情况设定。

1.2 构造标注文件

标注信息都存放在.txt中,其中每行代表一张图像的信息。若是train_list.txt和val_list.txt,则其每一行由图像文件的相对路径(相对于图像存放文件夹的父目录,例如1.1中的data/mydataset/)和该张图像的类别id组成,中间由空格分隔开;若是test_list.txt,则其每一行是图像文件的相对路径。如下所示,是train_list.txt中标注信息的例子:

train_img/train_0001.jpg 0
train_img/train_0002.jpg 1
...

【注意】图像相对路径的命名不可以出现空格和中文字符,应由英文字符和下划线等字符组成。类别id则是由数字组成。